Differential privacy
Differential privacy(DP)とは、データセット内の個人に関する情報を伏せたまま、データセット内のグループのパターンを記述することで、データセットに関する情報を公開するシステムである。差分プライバシーの背景にある考え方は、データベース内で任意の1つの置換を行う効果が十分に小さければ、問い合わせの結果は任意の一個人について多くを推測するために使用できず、したがってプライバシーを提供するというものである。 差分プライバシーの別の表現方法として、統計データベースに関する集計情報を公開するために使用されるアルゴリズムに対する制約として、その情報がデータベース内にあるレコードの個人情報の公開を制限するものがある。例えば、ある政府機関では、アンケート回答の機密性を確保しながら人口統計情報やその他の統計的集計情報を公開するために、また、企業では、社内分析者にも見えるように制御しながらユーザーの行動に関する情報を収集するために、ディファレンシャルプライバシーアルゴリズムが使用されています。 Braveで出てきた
wikipediaまじでえぐい
公共財すぎる
Differential Privacyの実現のためのモデル
自分のデータにプライバシーを保護する手段を施し、それを解析のためにサーバーに送信する
データに多くの誤差が生じ意味のある結果を得るためには膨大なデータが必要になる。
生データは信頼できるサーバーに送られ、そのサーバーがプライバシー保護技術を使用してデータを分析する
信頼できる結果を得るために必要なデータははるかに少なく、プライバシーは保護される。
1つの場所にある場合悪用、紛失、盗まれる可能性がある。
Shuffringの仕組み
https://scrapbox.io/files/63b7cce8fe558d001ea1aef2.png
Encode
データを二層の暗号化でローカルにエンコードする。
Shuffle
Shufflerはデータの送受信、グループ化、Shuffleをする役割を担う別個のサービスである。
明示的に識別できる特徴や到着時刻、IPアドレスなどの特定のユーザーと情報を関連付ける可能性のあるメタデータを削除する。
群衆の中に紛れ込むことがないようにグループ化する役割を担っている
Analyzerにデータを渡す前に第一層の暗号を解除する
Analyze
Analyzerはデータにアクセスし分析するために第二層目の暗号を解読する。
ユーザーと集中型サーバーの間にShufflingの中間ステップを導入していること。